1
トークン化とシーケンス
EvoClass-AI004Lecture 4
0
🤖
ビープブー!ようこそ、中尉!以下のサブトピックを選択して、AIがトークン化を通じて「読む」仕組みを見てみましょう。
Py-Bot コマンドライブ
ビープブー! こんにちは、中尉!AIに文章を読ませるには、まず単語を小さな「レゴブロック」のように切り刻む必要があります。コンピュータが単語を数字に変換する仕組みを学びたいですか?
トピックの進捗0%
素晴らしい選択です!トークンはレゴブロックのようなものです。「friendship」のような単語は「friend」や「ship」などの小さな部分に分けられます。たった一つの「.」さえもトークンになります!AIにとっては、長い文全体よりもこれらの小分けされた部分の方が扱いやすいのです。
1
サブトピック1
トークンとは何か?
"friend"や"ship"のような小さな構成要素にテキストを切り刻むこと
見てください!トークンが得られたら、AIはそれぞれに秘密の識別番号を与えます。これらの数字が「シーケンス」となります。覚えておいてください:順序が重要です!「The dog bit the man」(犬が男を噛んだ)と「The man bit the dog」(男が犬を噛んだ)は同じブロックを使っていますが、順序によって全く異なる物語になります!
2
サブトピック2
シーケンスの力
順序がすべてである数学的なリストにブロックを変換すること
ご存知ですか?AIには「コンテキストウィンドウ」というものがあり、まるで手の大きさのようなものです。一度に「頭の中」に保持できるトークンの数に限りがあり、先頭の部分から忘れ始めるのです!
知っていましたか?
AIには「コンテキストウィンドウ」というものがあり、まるで手の大きさのようなものです。一度に「頭の中」に保持できるトークンの数に限りがあり、先頭の部分から忘れ始めるのです!
読み込み中...
⭐⭐⭐
ミッション完了!
あなたはトークンの達人です!